home *** CD-ROM | disk | FTP | other *** search
/ ftp.cs.arizona.edu / ftp.cs.arizona.edu.tar / ftp.cs.arizona.edu / icon / newsgrp / group03a.txt / 000021_icon-group-sender_Thu Feb 27 12:24:36 2003.msg < prev    next >
Internet Message Format  |  2003-12-22  |  2KB

  1. Return-Path: <icon-group-sender>
  2. Received: (from root@localhost)
  3.     by baskerville.CS.Arizona.EDU (8.11.1/8.11.1) id h1RJNMc10038
  4.     for icon-group-addresses; Thu, 27 Feb 2003 12:23:22 -0700 (MST)
  5. Message-Id: <200302271923.h1RJNMc10038@baskerville.CS.Arizona.EDU>
  6. Subject: Help with high level guidance on text searching algorithms
  7. To: icon-group@cs.arizona.edu
  8. From: "David Gamey" <dgamey@ca.ibm.com>
  9. Date: Thu, 27 Feb 2003 10:34:33 -0500
  10. X-MIMETrack: Serialize by Router on D01ML391/01/M/IBM(Release 5.0.11 +SPRs MIAS5EXFG4, MIAS5AUFPV
  11.  and DHAG4Y6R7W, MATTEST |November 8th, 2002) at 02/27/2003 10:33:54 AM
  12. Errors-To: icon-group-errors@cs.arizona.edu
  13. Status: RO
  14.  
  15. Hi all,
  16.  
  17. I've been checking some links for different algorithms and how they apply
  18. to different problems.  They field has really exploded since the last time
  19. I looked in detail.  A quick poke about in the IPL didn't turn up anything.
  20. I did find lots of detailed links (off the agrep site)  but I really want
  21. to see the forest (not the trees, branches and roots) right now.  Perhaps
  22. someone could give me a pointer or two.
  23.  
  24. The problem I'm looking at is related to searching through sets of text
  25. looking for commonality (substrings not patterns - although that would be
  26. of secondary interest).  I'm not looking for optimal or minimal sets of
  27. substrings but relatively good matches.   Given a set of messages, I'd like
  28. to be able to categorize them into sets that share common characteristics -
  29. probable this, probable that.  This has to be similar to things like search
  30. engines and spam filters do.
  31.  
  32. Thanks, in advance.
  33.  
  34. David
  35.  
  36.  
  37.